بهبود صحت ابهام‌زدایی نام نویسنده با استفاده از خوشه‌بندی تجمّعی

نویسندگان

چکیده مقاله:

Today, digital libraries are important academic resources including millions of citations and bibliographic essential information such as titles, author's names and location of publications. From the view of knowledge accumulation management, the ability to search fast, accurate, desired contents, has a great importance. The complexity and similarity in these resources cause many challenges and ambiguities. One of the most of these challenges is the author name disambiguation which makes an extensive scope of research. Although many effective methods have been developed by using clustering techniques in disambiguation of the author's name, the accuracy of these methods is not acceptable and still there are some problems such as fragmentation and error in the produced results of these methods, since there is no uniform standard of citations, various combinations, and numerous, written, verbal patterns. In fact, experiences have shown that the use of a single method to disambiguate names does not provide results with a high accuracy despite concerns expressed above. In this paper, a new method is proposed to disambiguate author names in different formats and combinations with more accuracy. The proposed solution carries out the disambiguation in two steps; In the first step, agglomerative hierarchical clustering algorithm produces clusters using similar functions and different thresholds. In the second step, clusters produced by clustering ensemble technique in the previous stage are combined to provide more accurate clusters with less fragmentation. The proposed method is experimentally evaluated by conducted DBLP datasets with K criterion. The evaluation results show that the proposed method enhances the accuracy of disambiguation of author names in different formats.  

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بهینه‎سازی پرتفوی سهام با استفاده از روش حرکت تجمعی ذرات

مسئله بهینه‏سازی‏ مارکویتز و تعیین مرز کارای سرمایه‏گذاری، زمانی‎که تعداد دارایی‏های قابل سرمایه‏گذاری و محدودیت‏های موجود در بازار ‏کم باشد، توسط مدل‏های ریاضی حل‎شدنی است. اما هنگامی‏که شرایط و محدودیت‏های دنیای واقعی در نظر گرفته شود، مسئله بهینه‏سازی پرتفوی به‎راحتی با استفاده از شیوه‏های ریاضی ‎حـل نمی‏شود. به‎همین دلیل استفـاده از شیوه‏های ابتکاری همچون شبکه‏های عصبی و الگوریتم‏های تکاملی...

متن کامل

هم نویسنده ای به نام و هم روانپزشکی توانا

استاد دکتر اصغر الهی در دوم اردیبهشت ۱۳۲۳ در مشهد متولد شد. تحصیلات ابتدایی و متوسطه را در همان شهر به پایان رساند و موفق به دریافت درجه دکترا در رشته پزشکی از دانشگاه علوم پزشکی مشهد شد. دکتر الهی آموزش روانپزشکی را از سال 1355 در بیمارستان روزبه آغاز کرد، اما پیش از آن مدتی را در فرانسه گذراند. قرار بود دوره تخصصی خود را در شهر پاریس طی کند، اما غربت را تاب نیاورد و زیستن در میان مردمان سرزمی...

متن کامل

بهبود صحت استخراج دمای سطح زمین از باندهای حرارتی ماهوارة لندست با استفاده از رگرسیون خطی و مشاهدات زمینی

پایش تغییرات دمای سطح زمین حاصل از نوسانات فصلی و غیرفصلی به دلیل تأثیر بسیار آن بر محیط‌زیست انسانی و طبیعی، امری ضروری است. به‌منظور پایش پیوستة دمای سطح زمین با هزینة اندک و سرعت زیاد، از تصاویر ماهواره‌ای سنجش‌ از دور استفاده می‌شود. در این پژوهش، نخست با بهره‌گیری از سه روش متداول استخراج دما مبتنی بر رابطة پلانک، دمای سطح زمین در محدودة دریاچة ارومیه از تصاویر ماهوارة لندست استخراج شد؛ سپ...

متن کامل

بررسی بهبود صحت طبقه‌بندی تیپ های جنگل با استفاده از ادغام داده‌های ماهواره‌ای (مطالعه موردی: طرح جنگل‌داری آذررود، سوادکوه -مازندران)

برای بررسی بهبود صحت طبقه‌بندی تیپهای جنگلی با استفاده از داده‌های ماهواره‌ای از داده‌های چند طیفی و باند PAN سنجندهETM+  طرح جنگل‌داری آذررود واقع در شهرستان سوادکوه استفاده شد. باندها از نظر خطای رادیومتری و هندسی مورد بررسی و بازبینی قرار گرفتند. باند 1 به‌دلیل وجود خطای رادیومتری حذف گردید. با تصحیحات هندسی ضمن رفع اثر خطای جابه‌جایی ناشی از پستی و بلندی با استفاده از 21 نقطه کنترل و مدل رق...

متن کامل

ارزیابی کارایی تکنیک نمونه‌‌گیری تجمعی بوت‌‌استرپ بر صحت روش بهترین پیش‌‌بینی نااُریب خطی ژنومی

به منظور افزایش صحت ارزیابی‌‌های روش بهترین پیش‌‌بینی نااُریب خطی ژنومی (GBLUP)، تکنیک نمونه‌‌گیری تجمعی بوت‌‌استرپ (بگینگ) بکار گرفته شد. بدین منظور ژنومی حاوی 10000 نشانگر تک‌‌نوکلئوتیدی دو آللی (SNP) با فواصل یکسان روی 10 کروموزوم هریک به طول 100 سانتی‌‌مورگان شبیه‌‌سازی شد. برای ایجاد عدم تعادل پیوستگی (LD) بین SNPها و جایگاه‌‌های‌ ژنی کنترل‌‌کنندة صفات کمی (QTL)، به مدت 100 نسل بین 100 فرد ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 14  شماره 4

صفحات  117- 128

تاریخ انتشار 2018-03

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023